New York Times | 2024-02-15 | 20:40:18

OpenAI разкрива A.I. Което мигновено генерира зашеметяващи видеоклипове

През април започваща компания в Ню Йорк, наречена Runway AI, показа технология, която разрешава на хората да генерират видеоклипове, като крава на рожден ден или куче беседва на смарт телефон, просто като напишете изречение в поле на екрана на компютъра.

Четирисекундните видеоклипове бяха замъглени, накъсани, изкривени и смущаващи. Но те бяха явен знак, че технологиите за изкуствен интелект ще генерират все по-убедителни видеоклипове през идните месеци и години.

Само 10 месеца по-късно започващата компания OpenAI в Сан Франциско разкри сходна система, която основава видеоклипове, които наподобяват по този начин, като че ли са извадени от холивудски филм. Демонстрацията включваше къси видеоклипове — основани за минути — на вълнисти мамути, които тичат през заснежена поляна, страшилище, гледащо топяща се свещ, и улична сцена в Токио, като че ли снимана от камера, прелитаща през града.

ChatGPT chatbot и неподвижният -генератор на изображения DALL-E е измежду многото компании, които се надпреварват да подобрят този тип неотложен видео генератор, в това число започващи компании като Runway и софтуерни колоси като Гугъл и Meta, притежателят на Фейсбук и Instagram. Технологията може да форсира работата на опитни режисьори, като в същото време размени напълно по-малко опитните цифрови актьори.

водни знаци, които ги разпознават като генерирани от ИИ. Но компанията признава, че те могат да бъдат отстранени. Те също могат да бъдат сложни за забелязване. (Ню Йорк Таймс добави водни знаци „ Генерирано от AI “ към видеоклиповете с тази история.)

Системата е образец за генеративен AI, който може неотложно да основава текст, изображения и звуци. Подобно на други генеративни A.I. технологии, системата на OpenAI се учи посредством анализиране на цифрови данни - в този случай видеоклипове и надписи, описващи какво съдържат тези видеоклипове.

OpenAI отхвърли да каже от какъв брой видеоклипа е научила системата или от кое място са пристигнали, като се изключи това, че образованието включва както публично налични видеоклипове, по този начин и видеоклипове, които са били лицензирани от притежателите на авторски права. Компанията споделя малко за данните, употребявани за образование на нейните технологии, най-вероятно тъй като желае да резервира преимущество пред съперниците - и е била съдена неведнъж за потребление на предпазен с авторски права материал.

съди OpenAI и нейния сътрудник, Microsoft, през декември, с искане за нарушение на авторски права върху новинарско наличие, обвързвано с A.I. системи.)

Sora генерира видеоклипове в отговор на къси описания, като „ луксозно изобразен книжен свят на коралов риф, цялостен с цветни риби и морски създания “. Въпреки че видеоклиповете могат да бъдат впечатляващи, те не постоянно са съвършени и могат да включват странни и нелогични изображения. Системата, да вземем за пример, неотдавна генерира видеоклип на някой, който яде бисквитка - само че бисквитката в никакъв случай не е ставала по-малка.

DALL-E, Midjourney и други генератори на неподвижни изображения са се подобрили толкоз бързо през последните няколко години, че в този момент създават изображения, съвсем неразличими от фотосите. Това направи по-трудно идентифицирането на дезинформация онлайн и доста цифрови художници се оплакват, че е затруднило намирането на работа за тях.

„ Всички се смяхме през 2022 година, когато Midjourney пръв излезе и сподели: „ О, това е сладко “, сподели Рийд Саутен, концептуален художник на филми в Мичиган. „ Сега хората губят работата си поради Midjourney. “

Източник: nytimes.com